SEGMENTASI DOKUMEN TEKS DENGAN METODE TEXTTILING

نویسندگان

چکیده

Dalam penelitian ini, kami akan melaporkan pada segmentasi teks dokumen pidato bahasa Indonesia. Sebagai hasil dari penggunaan Automatic Speech Recognition (ASR), ditranskripsi menjadi tanpa batas untuk setiap dokumen. Dokumen-dokumen tersebut tentunya perlu disegmentasi sesuai dengan topiknya. Kami menerapkan metode TextTiling berbagai teknik pembobotan istilah seperti TF-IDF, TF-IDF-Mutual Information, TF-IDF Mutual Information-Word Similarity, dan TF-IDF-Word Frequency mengukur kemiripan antar segmen. Hasilnya menunjukkan Information berkinerja lebih baik di sebagian besar koleksi.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Klasifikasi Komponen Argumen Secara Otomatis pada Dokumen Teks berbentuk Esai Argumentatif

Abstrak Dengan pengenalan argumen secara otomatis dari dokumen teks, penulis esai dapat melakukan inspeksi pada teks yang mereka tulis. Hal ini akan membantu penilaian esai secara lebih objektif dan tepat karena penilai esai akan melihat seberapa baik komponen argumentasi terbentuk. Beberapa peneliti mencoba untuk melakukan pendeteksian dan klasifikasi argumen serta penerapannya pada berbagai d...

متن کامل

Probabilistic Latent Semantic Analysis (PLSA) untuk Klasifikasi Dokumen Teks Berbahasa Indonesia

Abstrak Salah satu pekerjaan yang ada di dalam mengelola dokumen adalah bagaimana menemukan intisari dari dokumen. Topic modeling merupakan teknik yang dikembangkan untuk menghasilkan representasi dokumen berupa kata-kata kunci dari dokumen. Kata-kata kunci tersebut yang akan digunakan dalam proses pengindeksan serta pencarian dokumen untuk ditemukan kembali sesuai kebutuhan pengguna. Pada pene...

متن کامل

Klasifikasi Data Cardiotocography Dengan Integrasi Metode Neural Network Dan Particle Swarm Optimization

Backpropagation (BP) adalah sebuah metode yang digunakan dalam training Neural Network (NN) untuk menentukan parameter bobot yang sesuai. Proses penentuan parameter bobot dengan menggunakan metode backpropagation sangat dipengaruhi oleh pemilihan nilai learning rate (LR)-nya. Penggunaan nilai learning rate yang kurang optimal berdampak pada waktu komputasi yang lama atau akurasi klasifikasi yan...

متن کامل

Penambahan emosi menggunakan metode manipulasi prosodi untuk sistem text to speech bahasa Indonesia

Abstrak—Text To Speech (TTS) merupakan suatu sistem yang dapat mengonversi teks dalam format suatu bahasa menjadi ucapan sesuai dengan pembacaan teks dalam bahasa yang digunakan. Fokus penelitian yaitu suatu konsep pengucapan natural, dengan usaha “memanusiakan” pelafalan sintesa suara sistem Text To Speech yang dihasilkan. Kebutuhan utama yang digunakan untuk sistem Text To Speech dalam peneli...

متن کامل

TEKS Correlations

TEKS Objective Session Coverage (A) relate the nation's health goals and objectives to individual, family, and community health; (B) examine the relationship among body composition, diet, and fitness; (C) explain the relationship between nutrition, quality of life, and disease; (D) describe the causes, symptoms, and treatment of eating disorders; (E) examine issues related to death and grieving...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ژورنال

عنوان ژورنال: JIF: Jurnal Imiah Informatika

سال: 2022

ISSN: ['2615-1049', '2337-8379']

DOI: https://doi.org/10.33884/jif.v10i01.4509